专题丨运营商视角下的算力网络技术及实践研究
作者简介
吴帅
中国联合网络通信集团有限公司高级工程师,主要研究方向为算力网络、智算中心、数据中心、双碳节能等。
韩振东
中国联合网络通信集团有限公司高级工程师,主要研究方向为云计算、算力网络、智算中心、数据中心、双碳节能等。
王佳
中国联合网络通信集团有限公司高级工程师,主要研究方向为算力网络、双碳节能等。
蔡航
中讯邮电咨询设计院有限公司工程师,主要研究方向为算力网络、数据中心等。
论文引用格式:
吴帅, 韩振东, 王佳, 等. 运营商视角下的算力网络技术及实践研究[J]. 信息通信技术与政策, 2024, 50(2): 40-45.
运营商视角下的算力网络技术及实践研究
吴帅1 韩振东1 王佳1 蔡航2
(1.中国联合网络通信集团有限公司,北京 100032;
2.中讯邮电咨询设计院有限公司,北京 100048)
摘要:算力网络是云化网络发展演进的下一个阶段,是运营商摆脱“管道”提供商困境、支撑业务高质量发展的必然选择。从算力网络的本质内涵出发,在对算力网络架构及实现路径深入分析的基础上,通过某运营商的算力网络实践阐述如何打造一体共生的精品算力网络,支撑数字经济高质量发展、赋能千行百业。
关键词:算力网络;全光网络;算网融合
0 引言
数字基础设施是国家的核心竞争力,其对支撑经济社会发展的战略性、基础性、先导性作用日益凸显。近年来,国家陆续发布相关政策,推动建设安全、可靠的新型数字基础设施。《关于加快构建全国一体化大数据中心协同创新体系的指导意见》提出构建一体化算力服务体系,鼓励算力与算法、数据、应用资源的一体化协同创新,促进数据中心与网络的高效供给对接和协同发展[1]。算力和网络是数字社会的基石和底座,是所有信息系统的动力引擎,支撑数字经济发展,推动各行各业数字化转型。以聊天生成型预训练变换模型(Chat Generative Pre-trained Transformer,ChatGPT)为代表的人工智能(Artificial Intelligence,AI)技术的快速发展,加速了智能社会的到来,新技术、新应用、新场景、新服务推动形成云、网、边、端、业融合服务新业态,呼唤着算力网络的到来。
1 算力是经济增长的新引擎
算力是数字经济发展的核心动力和衡量指标。狭义的算力是指信息数据的处理能力, William D.Nordhaus[2]认为“算力是设备根据内部状态的改变,每秒可处理的信息数据量”;广义的算力是指推动数字经济发展的新动能。在数字经济时代,算力、算法、数据重新定义数字经济时代生产力水平,在数字世界智能可以理解为数据、算力、算法之和(见图1)。算力是智能的基础平台,是新的生产力;算法是新的生产关系,通过科学研究实现;数据是新的生产资料,来自于千行百业的生产资料。算法决定数字经济的高度,数据决定数字经济的深度,算力决定数字经济的速度。
图1 算力、算法、数据三要素关系图
数字时代,算力的重要性日益凸显。据测算[3],算力方面每投入1 元,将带动3~4 元国内生产总值(Gross Domestic Product,GDP)经济增长。2022年是我国算力产业启动“元年”,截至2022年底,我国算力总规模已达全球第二,算力总量为180 EFLOPS;2023年更是我国算力产业爆发式增长的一年,各级政策为算力高质量发展领路护航,算力基础设施建设加速提质并向智能算力布局,算力创新应用井喷,加速推动数字经济与实体经济深度融合。预计未来5年,全球算力总规模年均增速将超过50%,成为经济增长的新引擎[4]。算力的高速增长呼唤算力的高质量发展。
2 算力网络概念与架构
2.1 算力网络的出现
算力网络是对算力高质量发展的一种回应。随着全球进入大数据时代,数据处理出现三级架构:终端、边缘和数据中心,算力呈现网络化趋势,算力资源从传统集中部署转向多级化演进,边缘计算不断涌现成为规模化算力的重要补充。如何专业、弹性、协作实现分布在云—边—端算力的高效协同,算力网络的出现是解决问题的一个重要途径。
2.2 算力网络的本质
算力网络既不是一项具体的技术,更不是一个具体的设备。从宏观来看,算力网络是一种思想,一种理念。从微观来看,算力网络是一种架构与性质完全不同的网络,是云化网络发展演进的下一个阶段[5]。算力网络是将算力资源彻底融入通信网络,以一个更整体的形式提供最符合用户需求的算力资源服务,是一种根据业务需求在云、网、边之间按需分配和灵活调度计算资源、存储资源以及网络资源的新型信息基础设施[3]。算力网络的目标是实现“算力泛在、算网共生、智能编排、一体服务”,逐步推动算力成为与水、电一样,可“一点接入、即取即用”的社会级服务,达成“网络无所不达、算力无所不在、智能无所不及”的愿景。
算力网络本质是打造算网组合优势、增强网的变现能力,实现算网双赢。算力网络一般具备弹性、敏捷、安全、感知、可视等特征。弹性,可以提供“带宽可调整、时长可定制”的弹性连接服务;敏捷,具备泛在算力敏捷接入的能力,用户不需要关心网络中的算力资源和分布情况;安全,可以实现数据的安全存储和加密传输,可以有效应对外部攻击和数据泄露风险;感知,为不同应用提供差异化的服务等级协议(Service-Level Agreement,SLA)保障;可视,通过应用、算力、网络的关联映射,构建算网高效联结。
2.3 算力网络的架构
算力网络架构的核心要素是算、网及脑。算是指算力,包括基于中央处理器(Central Processing Unit,CPU)芯片服务器提供的基础算力、基于图形处理器(Graphics Processing Unit,GPU)/神经网络处理器(Neural network Processing Unit,NPU)等提供AI训练推理能力的智能算力,以及基于超级计算机及高性能计算(High Performance Computing,HPC)集群提供的超算能力。网是指通信网络,IPv6+技术、光交叉连接(Optical Cross-Connect,OXC)全光底座及基于时延动态调优等技术打造的确定性低时延网络,是算力网络实现的技术基础。脑是指算力网络的大脑,算网协同由上层大脑完成,脑是算力网络发挥价值的关键所在。图2为算力网络架构逻辑图。
图2 算力网络架构逻辑图
对于算力网络来说,数据中立是商业前提,数据的上传、管理和交易需要安全、可信的算力网络,实现数据“可用不可见”“可用不可拥”。高效算力是技术基础,融合通算、智算以及超算等多种异构性算力,通过IPv6+全光网络实现算力高效传送。算网协同构建算网一体化编排、智能化运维,“以网强算”“以网促算”提供差异化能力。
2.4 算力网络实现路径
基于两种视角,算力网络有两种实现路径,对应两种模式。一是云服务商视角算力网络实现路径,算中有网,以云为中心的算网融合[6]。把异构、分布的算力连接协同成统一的算力资源池,进行算力资源运营,主要由云侧完成,网络提供连接支撑。这是一种强平台模式,互联网的巨大成功见证了这种强平台模式的崛起(见图3)。二是运营商视角算力网络实现路径,网中有算,以网络为中心的算网融合。通过网络感知、编排和调度算力,算网深度融合,通过网络的分布式协同来实现对网内各种服务的合理调度和资源的有效配置,算力可获得高于非跨域场景的连接服务[7],这是一种强网络模式(见图4)。
图3 云服务商视角算力网络实现路径图
图4 运营商视角算力网络实现路径图
两种模式目标一致,即调度资源为用户提供一致性业务体验。但路径不同,云服务商模式以应用/调用为主要手段,不对网络层进行假设,从特定场景入手,先试先行;运营商模式以网络为主要手段,云网资源集约化部署,一体化供给,考虑普适场景,框架通用化。在运营商视角下的算力网络路径,用户可获得更优业务体验。
3 算力网络实践
3.1 运营商需要算力网络支撑高质量发展
在2G、3G时代,运营商业务与网络紧密结合,构建用于连接的基础网络,提供话音、专线、短信等业务,对社会发展作出了巨大贡献,并获得了良好效益。但随着宽带和云业务的壮大,个性化、差异化的服务成为互联网业务的主流,仅提供流量服务的运营商逐渐低值化、管道化。因此,运营商必须加强技术创新与变革,构建差异化竞争能力,利用网络优势赋能应用,才能与业务发展形成良性互动,实现可持续发展,而算力网络正是重回高质量发展快速轨道的保障。
目前,各大运营商优化数据中心全国布局架构,围绕国家“东数西算”八大枢纽加速建设,匹配“东数西算”工程,加大投入力度,打造中心+边缘多元算力,推动云网向算网一体演进。
3.2 某运营商算力网络实践
某运营商(以下称“运营商A”)致力于打造架构先进、安全可靠、服务卓越的算力网络新布局,构建以算力为核心的算网融合新生态,提供联接、感知、计算、智能、安全的算网一体化服务,为数字经济打造“第一算力引擎”[8]。
运营商A围绕算力网络算、网、脑三大要素,从算力供给、算力输送、算力调度和算力服务4个方面着手,形成布局合理、技术先进、运营高效的算力供给;实现结构优、运力强、体验好的算力输送;构建生态丰富、泛在接入、智能调度的算力调度;提供算网一体、场景多样的算网服务。
在算力供给方面,一是夯实算力底座,打造布局合理、技术先进、安全可靠、绿色低碳、智慧运营的算力中心;二是优化资源分布,围绕“东数西算”八大枢纽节点结合自身资源禀赋确定重点区域,打造“一城一池”;三是加大资源储备,推进机柜及云资源的建设;四是推动技术演进,引入极致液冷、AI调优、新型算力等,实现极致算效;五是加强统一运营,提升数字化运营效率,实现资源可视、可管、可控,最终形成云、网、边一体化多层级算力布局。
在算力输送方面,提出打造算力时代的全光底座,通过覆盖升级与能力升级,建成一张超广覆盖、超大带宽、超高可靠、超低时延、智能灵活的高品质全域、全光大网,构建智能、敏捷、开放的超强运力全光底座。全光底座助力实现不同算力之间的高速互联、敏捷调度。同时,面向客户重点打造差异化优势IP承载网,构建“东数西算”专用平面,打造算力中心到算力中心的高效互访;发挥综合承载优势,打造架构领先的智能城域网,提升边缘算力接入能力;最终全面实现基于SRv6 /IPv6+的算力网络承载底座升级。
在算力调度方面,随着“东数西算”工程的推进,我国东西部数据要素流动显著提升,这需要上层系统具备灵活、敏捷、智能的云—网—边协同调度能力。运营商A建设算网一体化编排调度平台,通过广泛的算力纳管,实现异构、泛在的算力统一管理和调度;通过泛在的网络接入,实现边缘节点的广泛覆盖,提供随时、随地、随需的网络接入;最终实现在云、网、边、端之间按需分配和智能调度算网资源的能力。
在算力服务方面,运营商A在满足跨域协同、多云协同及云边协同等需求的基础上,深耕算力合作生态,实现算网服务的一体化调用,提供网络定制化、差异化及确定性等特性的服务化能力,实现算网资源一站式申请、自动化交付、一点监控、一点运维,全面提升网络服务能力。同时,面向车联网、工业互联网、智慧医疗等行业典型应用场景,提供定制化的算网一体解决方案,打造差异化的核心竞争力。
4 算网融合发展挑战与建议
算力网络已成为行业共识,也是运营商未来高质量发展和布局的重要方向,目前算力网络发展还存在一些挑战(见图5)。
图5 算力网络挑战
4.1 缺少算网融合标准体系的顶层设计
目前,算网融合在概念定义、应用场景、参考架构等方面尚未形成统一共识,亟需构建完善的算网融合标准体系,加快构建算力多元泛在与网络智能化,需要各专业领域打破壁垒,按照统一路线,实现计算与网络技术的融合创新[8]。
4.2 商业模式仍需进一步探索
算网融合应用场景差异大,服务源多样,资源整合与交易涉及面广,单靠一家难以支撑,亟需构建开放共荣的生态。目前,增强现实(Augmented Reality,AR)、AI、超算等业务入口不占优,算力服务一般只有转发面没有控制面需求,未来发展应以业务需求驱动算网融合,平衡网络感知业务的代价与专注提升带宽,保证传输质量以及获取体验、效率收益。
4.3 产品方案碎片化阻碍技术创新
算网资源泛在、异构、海量,服务场景碎片化显著。算网融合服务如何实现跨厂商、跨应用、跨地域的集成交互成为技术层面上需要努力的方向。除了建立健全标准体系外,还需构建统一、开放的应用创新平台,进行架构、能力、接口等技术验证。
4.4 算网新趋势提出更高要求
一是算力智能化,数字世界和物理世界走向融合,AI将从上层应用向底层基础设施蔓延,智能敏捷、随愿自治将成为智能社会算力设施的重要标签。二是算力绿色化,随着碳达峰碳中和目标的提出,以数据中心为代表的算力资源节能降耗成为关注焦点。三是算力可信化,云—边—端多级算力网络算力带来安全边界模糊化、网络暴露面增加、复杂隐蔽攻击快速传播等安全问题,需要构建零信任安全体系,实现网络“不被控”、攻击“不可达”、隐身“不可知”,从单点可控迈向云—边—端全面可信。
5 结束语
随着数字经济建设不断迈向新台阶,算网融合成为未来算力发展的方向。构建开放共享的算力,生态共生的平台,算网一体的网络,实现“一个大脑、一个身体”的一体共生算力网络已是大势所趋。但目前算力网络的研究与实践尚处于前期阶段,算力网络的进一步发展还面临诸多挑战。对于运营商来说,短期发展可依托政策优势,通过优化整合既有网络与算力资源提升客户体验,进而抢占先机;中长期发展则需要通过业务驱动和模式创新构建竞争优势。算力网络研究与实践任重道远,希望本文可以为算力网络后续研究及高质量发展提供一定的借鉴。
Research on computing power network technology and practice from the perspective of operators
WU Shuai1, HAN Zhendong1, WANG Jia1, CAI Hang2
(1. China United Network Communications Group Co., Ltd., Beijing 100032, China;
2. China Information Technology Design & Consulting Institute Co., Ltd., Beijing 100048, China)
Abstract: The computing power network is the next stage in the development and evolution of cloud networks, and it is an inevitable choice for operators to break away from being “pipeline” providers and support high-quality development of their services. Commencing from the essence of the computing power network, this article analyzes the architecture and implementation path of computing power network in depth. Through the practice of a certain operator’s computing power network, it explains how to create an integrated, symbiotic, and high-quality computing power network, which is conducive to supporting high-quality development of the digital economy and empowering other industries.
Keywords: computing power network; all optical network; computing and network convergence
本文刊于《信息通信技术与政策》2024年 第2期
主办:中国信息通信研究院
《信息通信技术与政策》是工业和信息化部主管、中国信息通信研究院主办的专业学术期刊。本刊定位于“ 信息通信技术前沿的风向标,信息社会政策探究的思想库 ”,聚焦信息通信领域技术趋势、公共政策、 国家/产业/企业战略,发布前沿研究成果、焦点问题分析、热点政策解读等,推动5G、工业互联网、数字经济、人工智能、区块链、大数据、云计算等技术产业的创新与发展,引导国家技术战略选择与产业政策制定,搭建产、学、研、用的高端学术交流平台。
为进一步提高期刊信息化建设水平,为广大学者提供更优质的服务,我刊官方网站已正式投入运行,欢迎投稿!
推荐阅读
专题丨人工智能促进数据中心绿色节能研究
专题丨运营商大模型硬件基础设施创新及RDMA流量控制技术研究
专题丨绿色算力定义及关键技术研究
专题丨算网城市发展路径研究
专题丨综合算力发展现状与趋势分析
专题丨我国算力产业发展挑战与建议
导读:综合算力
《信息通信技术与政策》2024年第50卷第2期目次及摘要
你“在看”我吗?